Réduction de dimension en statistique et application en imagerie hyper-spectrale
نویسنده
چکیده
This thesis deals with high dimensional statistical analysis. We focus on three different problems motivated by medical applications : curve classification, pixel classification and clustering in hyperspectral images. Our approaches are deeply linked with statistical testing procedures (multiple testing, minimax testing, robust testing, and functional testing) and learning theory. Both are introduced in the first part of this thesis. The second part focuses on classification of High dimensional Gaussian data. Our approach is based on a dimensionality reduction, and we show practical and theorical results. In the third and last part of this thesis we focus on hyperspectral image segmentation. We first propose a pixel classification algorithm based on multi-scale analysis, penalised maximum likelihood and feature selection. We give theorical results and simulations for this algorithm. We then propose a pixel clustering algorithm. It involves wavelet decomposition of observations in each pixel, smoothing with a growing region algorithm and frontier extraction based on a voting scheme.
منابع مشابه
Classification of skin hyper-pigmentation lesions with multi-spectral images
According to clinical protocols, skin diseases are quanti ed by dermatologists throughout a treatment period, and then a statistical test on these measures allows to evaluate a treatment e cacy. The rst step of this process it to classify pathological interest areas. This task is challenging due to the high variability of the images in one clinical data set. In this report, we rst review algori...
متن کاملStratégies pour l'étiquetage et l'analyse syntaxique statistique de phénomènes difficiles en français : études de cas avec Talismane
RÉSUMÉ. Les outils statistiques robustes en TAL, tels que les étiqueteurs morphosyntaxiques et les analyseurs syntaxiques, utilisent souvent des descripteurs « pauvres », qui peuvent être appliqués facilement à n’importe quelle langue, mais ne prennent pas en compte les particularités de la langue. Dans cette étude, nous cherchons à améliorer l’analyse de deux phénomènes en français en injectan...
متن کاملCredit scoring, statistique et apprentissage
Les accords dits « Bâle 2 » sur la solvabilité des banques ont remis au goût du jour les techniques de scoring en imposant aux banques de calculer des probabilités de défaut et le montant des pertes en cas de défaut. Nous présentons dans cet exposé les principales techniques utilisées et les problèmes actuels. Le terme credit scoring désigne un ensemble d’outils d’aide à la décision utilisés pa...
متن کاملNouvel Algorithme pour la Réduction de la Dimensionnalité en Imagerie Hyperspectrale. (New Algorithm for Dimensionality Reduction Applied in Hyperspectral Image)
متن کامل
Identification à la limite de langages dans le cadre d’un bruit systématique
Pour étudier l’apprentissage à partir de données bruitées, il est usuel de se baser sur un modèle de bruit statistique. L’influence du bruit est alors envisagée selon des critères pragmatiques ou eux-mêmes statistiques, en se basant donc sur un paradigme prenant en compte une distribution des données. Dans cet article, nous étudions le bruit comme un phénomène non statistique, en définissant la...
متن کامل